Análisis de Precios de Viviendas por Metros Cuadrados

Objetivos

Importando las librerias

Importando los datos

1. EDA

1.1. Histogramas

Es interesante notar que la mayoría de las viviendas tienen 2 habitaciones, lo que podría indicar una demanda más alta de este tipo de vivienda en el área analizada. Las viviendas con 4 habitaciones son las menos comunes, lo que podría indicar una menor demanda o simplemente una menor disponibilidad de este tipo de vivienda

Es importante notar que la mayoría de las viviendas tienen 2 baños, lo que podría indicar una demanda más alta de este tipo de vivienda en el área analizada. Las viviendas con 4 baños son las menos comunes, lo que podría indicar una menor demanda o simplemente una menor disponibilidad de este tipo de vivienda.

Es notable que la mayoría de las viviendas disponen de un solo puesto de estacionamiento, lo que podría reflejar una mayor demanda de este tipo de propiedad en la zona analizada. Las viviendas con tres puestos de estacionamiento son raras, lo que podría sugerir una demanda más baja o simplemente una menor oferta de este tipo de propiedad

Es notable que la mayoría de las viviendas tienen entre 4 y 5 amenidades, lo que podría reflejar una mayor demanda de este tipo de propiedad en la zona analizada. Las viviendas con más de 7 amenidades son raras, lo que podría sugerir una demanda más baja o simplemente una menor oferta de este tipo de propiedad.

Este análisis del número de centros educativos cercanos proporciona información valiosa sobre cómo los factores educativos pueden influir en los precios de las propiedades.

Intervalo [0, 10): Las viviendas con un bajo número de centros educativos cercanos podrían tener precios variados. Aquí, los precios pueden estar más influenciados por otros factores, como la ubicación y las comodidades cercanas, en lugar de la proximidad a las instituciones educativas.

Intervalo [10, 20): A medida que aumenta ligeramente el número de centros educativos cercanos, es posible que algunas viviendas comiencen a mostrar una correlación entre el precio por metro cuadrado y la proximidad a las escuelas. Las familias que buscan educación de calidad podrían mostrar un mayor interés en estas viviendas, lo que podría contribuir a un aumento en los precios.

Intervalo [20, 30): En este rango, donde se encuentra un número moderado de centros educativos cercanos, es probable que las viviendas experimenten una mayor demanda debido a su accesibilidad a las escuelas. Esto podría resultar en una influencia positiva en los precios por metro cuadrado, ya que las familias podrían estar dispuestas a pagar más por la comodidad de tener escuelas cercanas.

Intervalo [30, 40): Con un gran número de viviendas en este intervalo, sugiere que muchas áreas tienen una densidad significativa de centros educativos. Esto podría estar relacionado con áreas urbanas densamente pobladas, donde la competencia por la vivienda es alta y, por lo tanto, los precios por metro cuadrado también podrían ser más elevados.

Intervalo [40, 50): Similar al intervalo anterior, este rango indica una cantidad considerable de centros educativos cercanos. Las viviendas en estas áreas podrían ser atractivas para las familias, lo que podría influir positivamente en los precios por metro cuadrado.

Intervalo [50, 60): En este rango, las viviendas podrían estar ubicadas en áreas con un enfoque en la educación. La presencia de un número significativo de centros educativos podría ser un factor importante en la determinación de los precios por metro cuadrado en estas áreas.

Intervalo [60, 70): Con solo un número limitado de viviendas en este intervalo, es probable que las áreas con un gran número de centros educativos sean excepciones. Sin embargo, estas áreas podrían tener precios más altos debido a su singularidad y a la alta demanda de familias que valoran la proximidad a las escuelas.

En general, este análisis sugiere que la proximidad a los centros educativos puede ser un factor influyente en los precios por metro cuadrado de las viviendas. Las áreas con una mayor cantidad de centros educativos podrían experimentar una mayor demanda y, por lo tanto, precios más altos debido a la comodidad que brindan a las familias en busca de educación de calidad para sus hijos.

1.2. Diagramas de cajas

1.3. Diagrama de dispersión

Sin el valor atipico 546

1.4. Diagrama de burbujas

2. Preprocesamiento

2.1. Eliminando las columnas no relevantes y vacias

2.2. Dumizacion de las variables categoricas

2.3. Dividiendo el conjunto de Datos

2.4. Comprobando la distribución de la variable dependiente

2.5. Vamos a normalizar la variable dependiente

2.6. Seleccion de Caracteristicas

2.6.1. Matriz de confusion

2.6.2 Tecnicas de seleccion de caracteristicas

En el proceso de selección de variables para la predicción de precios por metro cuadrado de viviendas, se evaluaron distintos métodos que tuvieron en cuenta la relevancia de cada atributo en el modelo. Los resultados indican que ciertas variables sobresalen en términos de apariciones en los diferentes métodos:

Cabe mencionar que la presencia de ciertas variables en varios métodos refuerza su influencia en la predicción de precios por metro cuadrado. No obstante, para obtener un análisis más exhaustivo y preciso, es crucial considerar el contexto y las interacciones entre estas variables. En ese sentido, se recomienda un enfoque más detallado, incluyendo la combinacion de este analisis con la exploracion de correlaciones.

2.6.3. Variables seleccionadas

4. Modelamiento

4.1. Regresión Lineal

4.2. RandomForest

4.3 XGBoost

4.3.1 XGBoost with GridSearch

4.4. Eleccion del modelo

Análisis de Resultados:

Elección del Mejor Modelo:

Basándonos en las métricas de rendimiento, el modelo Random Forest parece ser el mejor candidato. Tiene un buen equilibrio entre el rendimiento en los conjuntos de entrenamiento y prueba, y su R2 en el conjunto de prueba sugiere una capacidad decente para generalizar patrones no lineales en datos nuevos.

Recomendaciones:

5. Explicabilidad del modelo

5.1. Importancia de las variables

En general, estos resultados sugieren que el precio por metro cuadrado de una vivienda está influenciado por una combinación de factores, incluyendo su tamaño, el número de habitaciones y la cantidad y calidad de los servicios en las áreas circundantes.

5.2. Shap Values

Conclusiones

En este análisis exhaustivo de los precios de viviendas por metro cuadrado, hemos explorado diversas dimensiones de datos y aplicado técnicas avanzadas para comprender los factores clave que influyen en los valores inmobiliarios. A través del uso de herramientas como Jupyter Notebook, Python y bibliotecas como scikit-learn, XGBoost, matplotlib y plotly, hemos logrado obtener insights valiosos que pueden ser de gran utilidad para inversionistas y compradores interesados en propiedades.

Nuestro análisis ha destacado la importancia de factores como el tamaño de la vivienda, la ubicación geográfica y la presencia de servicios cercanos en la determinación de los precios por metro cuadrado. Observamos que el tamaño de la vivienda tiene una influencia significativa, donde propiedades más grandes tienden a tener precios por metro cuadrado más bajos. Además, la cercanía a centros educativos, de salud, profesionales y de entretenimiento también juega un papel crucial en la valoración de las propiedades.

A través de la selección de variables y la construcción de modelos tanto de regresión como de árboles, identificamos que el modelo Random Forest y Xgboost mostraron mejores rendimientos en la predicción de precios por metros cuadrados dado a su naturaleza algorítmica compleja que permite una estimación más optima sobre un problema que no tiene una tendencia lineal. No obstante, es importante destacar que los resultados podrían mejorar aún más con un aumento en la cantidad de registros en el conjunto de datos y una mayor inclusión de variables explicativas relevantes. La ingeniería de características y la recopilación continua de datos podrían enriquecer aún más la capacidad predictiva de los modelos.

En última instancia, este análisis subraya la necesidad de considerar múltiples factores al evaluar los precios de las viviendas por metro cuadrado. A medida que el mercado inmobiliario sigue evolucionando, la comprensión detallada de las relaciones entre las características de las propiedades y sus valores resulta fundamental para tomar decisiones informadas y estratégicas.